1
從統計可能性到凸規劃
MATH008Lesson 7
00:00

統計推斷問道:「根據這些數據,最有可能的底層參數是什麼?」本頁將這個問題與 凸優化結合起來。我們將機率性的可能性概念轉化為結構化的規劃問題,並證明在對數凹性條件下,尋找最佳估計等價於求解一個凸優化問題。

可能性框架

可能性函數 」是概率分佈 $p_x(y)$ 被視為參數 $x$ 的函數,對於固定的觀測樣本 $y$。為了估算 $x$,我們採用 最大可能性(ML)估計:選擇使觀測數據最可能出現的值。

$$\hat{x}_{ml} = \text{argmax}_x p_x(y) = \text{argmax}_x l(x)$$

為了計算效率,我們使用 對數可能性函數,$l(x) = \log p_x(y)$。由於對數函數是單調遞增的,它會保留最大值的位置,同時將獨立觀測結果的乘積轉換為易於管理的和式。

MLE 最優化程式(7.1)

我們將估計形式化為一個數學規劃:

$$\begin{array}{ll} \text{最大化} & l(x) = \log p_x(y) \\ \text{受限於} & x \in C \end{array}$$ (7.1)

此程式是一個 凸優化問題 若:

  • 對數可能性函數 $l$ 是 凹的 對於每個 $y$ 值。
  • 可行集 $C$(先驗資訊)由線性等式與凸不等式約束所描述。

整合約束與先驗資訊

ML 評估要求將 $p_x(y)$ 重新定義為零,當 $x \notin C$ 時,以明確施加物理或先驗約束。在優化空間中,這表示對違反這些約束的參數 $x$,對數可能性函數被賦予 $-\infty$ 值,有效地為優化器創造了一個無法穿越的障礙。

🎯 核心原則
從「最大可能性」轉向「凸規劃」的關鍵在於對數密度的凹性。若雜訊或分佈具有對數凹性,統計估計便成為一個全局可解的優化任務。